蛋白质组学和转录调控研究思路
狭义的转录组默认只包含mRNA,但是广义的转录组指的是细胞或组织中所有转录产物的集合,其中包含mRNA和非编码RNA(non-coding RNA, ncRNA)。非编码RNA包括具有调控功能的ncRNA和管家基因RNA(如tRNA、rRNA等)。对转录组中的非编码RNA,目前的研究多集中在具有调控功能的small RNA(以miRNA为代表),长链非编码RNA(long non-coding RNA, lncRNA)和环状RNA(circular RNA, circRNA)等,而这几类ncRNA的调控对象都和mRNA有关。
其中,Long non-coding RNA(lncRNA)也叫长链非编码RNA,是长度大于200nt的一类非编码RNA,主要从蛋白编码基因的反义链以及间隔区转录出来。lncRNA起初被认为是基因组转录的“噪音”,是RNA聚合酶II转录的副产物,不具有生物学功能。然而,后续有大量的研究表明,lncRNA参与了X染色体沉默、基因组印记以及染色质修饰、转录激活、转录干扰、核内运输等多种重要的调控过程。lncRNA的序列保守性较低,只有约12%的lncRNA可在人以外的其它生物中找到。哺乳动物蛋白编码基因占总RNA的1%,长链非编码RNA占总RNA的比例可达4%-9%,这些长链非编码RNA是基因功能研究的又一座宝库。
共价闭合、单链环状的RNA(CircRNA)是一类比较特殊的RNA,CircRNA没有游离的5′帽子结构和3′poly(A)结构,并且对核酸酶不敏感,因此比普通的线性RNA(linear RNA)更稳定,circRNA主要定位于细胞质中,并且可以被储存在外泌体中。其中大多数circRNAs在不同物种间具有保守性和稳定性,并且circRNA表达具有细胞特异性、组织特异性以及发育阶段特异性。
miRNA是一类长度约为20-24 nt的具有调控功能的非编码RNA,在动物中,主要通过与靶基因mRNA的3′ UTR以不完全互补配对的方式结合,介导靶mRNA的翻译抑制;在植物中,主要与靶mRNA编码区或UTR特定位点以完全互补或近乎完全互补配对的方式结合,介导mRNA被剪切降解,miRNA参与各种各样的细胞活动和生物过程,例如细胞增殖和凋亡、生长发育、逆境病毒防御、癌症等等。这类RNA并不能编码蛋白,所以属于non-coding RNA家族中的一员,在不同物种间比较保守。关于miRNA数据分析,联川生物使用本公司自主开发的ACGT101-miR (LC Sciences, Houston, Texas, USA)软件,在miRNA靶基因预测方面,动物样本使用Targetscan、miranda两款预测软件,植物样本使用PsRobot软件进行。
得益于高通量测序和生物信息学的发展,人们通过生物信息学的方法在高通量测序数据中发现了许多传统实验无法挖掘的RNA。这些新型的非编码RNA除了转录前调控等功能外,还有一个重要的功能就是像海绵一样对miRNA有吸附作用(miRNA sponge)。这种具有miRNA吸附作用的RNA,我们称作内源性竞争结合RNA(Competitive endogenous RNA, ceRNA),ceRNA会竞争结合miRNA,继而被miRNA调控的靶基因会上调。目前已知的ceRNA有lncRNA(长链非编码RNA)、circRNA(环状RNA)等不同种类的RNA,可以通过构建circRNA-miRNA-mRNA或lncRNA-miRNA-mRNA等的ceRNA调控网络来解释这种内竞争机制。
蛋白质作为mRNA的翻译产物,行使具体功能,一般根据mRNA-蛋白的翻译关系,将转录组数据与蛋白质组数据进行关联。利用cytoscape软件或联川云平台(https://www.omicstudio.cn/index)云工具-网络图可以实现ncRNA-mRNA-Protein调控关系的可视化。
2.1:lncRNA-转录组-蛋白组联合分析
lncRNA调控mRNA方式主要分为两类,一类为顺式调控(cis regulation),即lncRNA调控与其邻近基因的表达。lncRNA顺式调控靶基因主要根据位置关系预测,定义染色体中上下游100kbp范围内存在差异表达的lncRNA与差异表达的mRNA,这类lncRNA构成顺式调控,cis调控主要依赖顺式作用元件(cis-acting element)进行,顺式作用元件是指存在于基因旁侧序列中能影响基因表达的序列,包括启动子、增强子、调控序列和可诱导元件等,它们的作用是参与核内基因表达的调控,顺式作用元件通常转录为非编码RNA;第二类调控方式为反式调控(trans regulation),即lncRNA跨染色体调控基因的表达,trans调控靶基因主要基于lncRNA与mRNA序列之间形成二级结构所需要自由能的大小,如果两条序列需要很低的自由能就可以结合,则两者间可能存在相互作用。由于反式调控预测准确性不高,结果较多,且验证较为困难,一般我们主要对顺式调控的差异mRNA和差异lncRNA进行预测分析,之后根据mRNA-蛋白的翻译关系,将mRNA与蛋白进行关联。
案例:
外泌体传递病毒遗传信息和免疫信号可能导致 ALV-J 感染的HD11细胞的免疫抑制和免疫耐受
发表期刊:Int. J. Biol. Sci.
影响因子IF:6.580
发表时间:2020.01
技术手段:RNA-seq,iTRAQ,qRT-PCR,PRM
研究内容:禽白血病病毒(ALV)是致癌逆转录病毒,不仅会引起免疫抑制,还会增加宿主对继发感染的易感性,外泌体在响应病毒感染而发生的信号转导级联中起着至关重要的作用。作者想探索外泌体在 ALV 传播和身体随后的免疫反应中的作用。作者使用RNA-seq和蛋白相对定量 (iTRAQ) 和绝对定量 (PRM) 的方法来检测在巨噬细胞注射 ALV 亚群 J (ALV-J) 后外泌体分泌的差异表达基因 (DEG) 和差异表达蛋白 (DEP)。RNA测序鉴定到受感染细胞中的 513个DEG,这些DEG涉及到紧密连接信号通路、TNF信号通路、沙门氏菌感染反应和免疫反应,以及其他重要的细胞过程。在843个lncRNA中观察到差异调节,显著富集的靶基因参与 Rap1 信号、HTLV-I 感染、紧密连接信号和其他信号通路。iTRAQ在感染细胞中共鉴定出 50 个 DEP,富集的蛋白质参与免疫反应、抗原加工、MHC 蛋白和肌球蛋白复合物的形成以及运输。转录组和蛋白质组的联合分析表明,有337个RNA和蛋白质之间有相关性,其中5个是显著的。在 RNA 和蛋白质水平上均富集到参与了癌症通路 PI3K-Akt信号通路,内吞作用,爱泼斯坦-巴尔病毒感染等。这些数据表明,外泌体是响应病毒感染的细胞间信号传递器。外泌体可以携带两种病毒核酸酸和蛋白质,使外泌体有可能参与其他细胞的病毒感染和细胞间免疫信号的传递。我们的测序结果证实了之前对外泌体的研究,并进一步发现外泌体可能导致免疫抑制和免疫耐受。
参考文献:
Ye F, Wang Y, He Q, Cui C, Yu H, Lu Y, Zhu S, Xu H, Zhao X, Yin H, Li D, Li H, Zhu Q. Exosomes Transmit Viral Genetic Information and Immune Signals may cause Immunosuppression and Immune Tolerance in ALV-J Infected HD11 cells. Int J Biol Sci. 2020 Jan 22;16(6):904-920. doi: 10.7150/ijbs.35839. PMID: 32140061; PMCID: PMC7053331.
2.2 miRNA-转录组-蛋白组联合分析
miRNA和转录组整合分析,是一个系统性双层次联合研究miRNA 调控基因表达的分子机制的方法。蛋白质是形式细胞功能的主要承担者,蛋白质组学( Proteomics)是从整体水平上研究细胞内蛋白质的组成、活动规律及蛋白质与蛋白质的相互作用,是功能基因组学时代一门新的学科,蛋白质组是细胞功能和状态的直接描述。miRNA-转录组-蛋白组学的联合分析是系统生物学的重要组成部分,也是目前转录调控mRNA以及蛋白质等联合分析的基础。
案例:
通过转录组学、miRNA 和蛋白质组学变化的综合分析来揭示miRNA在杂交黄鲶杂种优势中的关键作用
发表期刊:MOL CELL PROTEOMICS
影响因子IF:5.911
发表时间:2019.05
技术手段:miRNA,RNA-seq,TMT,PRM,RT-PCR
研究内容:杂种优势是一种复杂的生物学现象,其中杂交产生的后代与亲本相比表现出优越的表型特征。杂种优势广泛用于农业,例如渔业;然而其潜在的分子基础仍然难以捉摸。为了广泛地获得鱼类杂种优势分子层面的信息,作者使用下一代测序和质谱法分析了黄颡鱼、瓦氏黄颡鱼及其杂交黄鲶“黄优一号”这三种鲶鱼的肝脏的 mRNA、miRNA 和蛋白质水平的表达。结果表明杂交黄鲶在转录、转录后或蛋白质水平上很容易识别出非加性、同源表达偏向和表达水平优势模式,这为杂交过程中优势模型的广泛存在提供依据。这些差异基因/蛋白还参与免疫防御、新陈代谢、消化和吸收、细胞增殖和发育等几种不同的关键途径,表明了其参与生成后代杂种优势表型的重要机制。许多预测的 miRNA-mRNA-蛋白质通过RT-PCR 和 PRM 检测得到验证。作者认为后代中高表达生长、营养、喂养和抗病性相关的基因/蛋白质与遗传自母本或父本低表达的miRNA相匹配,这为杂种优势分子机制的解释提供重要参考。
参考文献:
Zhang G, Li J, Zhang J, Liang X, Zhang X, Wang T, Yin S. Integrated Analysis of Transcriptomic, miRNA and Proteomic Changes of a Novel Hybrid Yellow Catfish Uncovers Key Roles for miRNAs in Heterosis. Mol Cell Proteomics. 2019 Jul;18(7):1437-1453. doi: 10.1074/mcp.RA118.001297. Epub 2019 May 15. PMID: 31092672; PMCID: PMC6601203.2.3 ceRNA-miRNA-转录组-蛋白组联合分析
ceRNA调控网络(ceRNA networks)指这些非编码RNA如lncRNA和circRNA等会竞争结合microRNA,导致microRNA调控的靶基因发生变化,最终体现在蛋白的表达水平上,而microRNA处于ceRNA调控网络中的核心地位。一个ceRNA可以结合多个miRNA,这些ceRNA上与miRNA结合的位点被称作miRNA识别元件(miRNA recognition elements, MREs)。通常ceRNA上有一个甚至多个MRE,当ceRNA表达量上升时,microRNA就会被竞争结合,从而导致mRNA转录水平上升,最后蛋白表达水平上升,反之亦然,通常ceRNA上有一个甚至多个MRE。总之,当ceRNA表达量上升时,miRNA就会被竞争结合,从而导致mRNA转录水平上升,最后蛋白表达水平上升,反之亦然。ceRNA调控网络将lncRNA和circRNA、miRNA等ncRNA对mRNA的调控联系起来并延伸至蛋白组、代谢组等组学,近年来成为了科研工作者的研究热点。
案例:
通过全转录组和蛋白质组来分析与HCC相关的差异mRNA、miRNA、lncRNA 和 circRNA
发表期刊:ONCOGENE
影响因子IF:9.867
发表时间:2021.06
技术手段:miRNA,lncRNA,circRNA,mRNA,TMT,ROC,Survival curve,WB
研究内容:肝细胞癌(HCC)是原发性肝癌最常见的亚型,也是全球癌症相关死亡的主要原因之一。为了更深入地了解 HCC 的转录组学格局和分子机制,作者进行了HCC肿瘤以及HCC患者的相邻正常组织的基于TMT 标记的蛋白组学检测和全转录组测序。检测显示在患者HC肿瘤中与邻近的正常组织中,有977个差异表达蛋白 (DEP)、243个差异基因 (DEG)、555个差异miRNA、29个差异lncRNA和 895个差异circRNA。之后再结合The Cancer Genome Atlas(TGCA)数据库中HCC数据进行分析,确定了 56 个具有共同相对数量变化的 DEP-DEGs。功能通路分析显示这些DEP-DEGs主要富集在剪接体和各种代谢过程中。此外,发现hsa-miR-1266-5p、hsa-miR-128-1-5p、hsa-miR-139-5p、hsa-miR-34b-3p 和 hsa-miR-570-3p等miRNA参与调控上述枢纽基因/蛋白。lncRNA-mRNA、circRNA-mRNA的共表达和竞争性内源性RNA(Competitive endogenous RNA, ceRNA)调控网络显示了lncRNA和circRNA可能的调控作用。总之,我们通过蛋白质组学和转录组学研究探索了潜在的癌症生物标志物,为开发HCC的诊断或治疗靶点提供宝贵参考。
参考文献:
Xu F, Jiang L, Zhao Q, Zhang Z, Liu Y, Yang S, Yu M, Chen H, Zhang J, Zhang J. Whole-transcriptome and proteome analyses identify key differentially expressed mRNAs, miRNAs, lncRNAs and circRNAs associated with HCC. Oncogene. 2021 Jul;40(29):4820-4831. doi: 10.1038/s41388-021-01908-0. Epub 2021 Jun 21. PMID: 34155346.
3.1 mRNA可变剪接在转录组与蛋白质组两水平的相互验证
可变剪接使一个基因产生多个mRNA 转录本,不同 mRNA可能翻译成不同蛋白质.因此,通过可变剪接一个基因可能产生多个蛋白,极大地增加了蛋白多样性,而我们在蛋白层面对这些新蛋白进行鉴定,从而来验证转录组中可变剪切的分析。联川可以进行转录层面的同一基因mRNA各转录本定量和差异分析比较,以及翻译层面的同一蛋白各Isoform定量和差异分析比较。
参考文献:
Xanthopoulou A, Moysiadis T, Bazakos C, Karagiannis E, Karamichali I, Stamatakis G, Samiotaki M, Manioudaki M, Michailidis M, Madesis P, Ganopoulos I, Molassiotis A, Tanou G. The perennial fruit tree proteogenomics atlas: a spatial map of the sweet cherry proteome and transcriptome. Plant J. 2021 Nov 29. doi: 10.1111/tpj.15612. Epub ahead of print. PMID: 34842310.
3.2 转录组和蛋白组Pathway 的关联比较分析
无论是转录组测序还是蛋白质组分析的结果中,联川都会给出差异基因或差异蛋白的 Pathway代谢通路富集分析结果,比较关联分析两组学水平上的不同的Pathway 代谢通路,之后对能关联上的代谢通路中的蛋白/基因的相互对应及表达情况进行一致性分析,从而挖掘出通路中几个代表性的关键基因/蛋白,利用这两种不同的表达谱研究手段的不完整性和互补性, 通过综合分析而获得一个表达谱的“全景图”, 系统而全方位地研究动植物重要生物过程的调控机制。
参考文献:
Wu MX, Zou Y, Yu YH, Chen BX, Zheng QW, Ye ZW, Wei T, Ye SQ, Guo LQ, Lin JF. Comparative transcriptome and proteome provide new insights into the regulatory mechanisms of the postharvest deterioration of Pleurotus tuoliensis fruitbodies during storage. Food Res Int. 2021 Sep;147:110540. doi: 10.1016/j.foodres.2021.110540. Epub 2021 Jun 17. PMID: 34399517.
4.1 RNA组学验证:
如果想要开展后期验证,需要借助一些工具的辅助来帮助您证明/证否自己的猜想,这里我们简单为您整理了一些常用的验证技术。
1.过表达载体(overexpression vector)
在细胞或生物体内大量表达想要的目的RNA片段可采用过表达的方式,目前有非常成熟的商业化过表达载体提供。首先过表达载体一般来源于细菌的质粒,分为目的基因、启动子、终止子和标记基因这四个主要部分。将过表达载体“送入”细胞中目前普遍采用慢病毒包装的方法来进行。例如使用慢病毒包装好的MSCV-miR-34b/34c质粒载体,其骨架主要是pMSCV PIG,当使用这些包装好的慢病毒入侵小鼠细胞系时,被侵染的小鼠细胞会过量表达miR-34b/34c。
2.基因缺陷型细胞系(gene deficient cell line)
一般会选用Dicer缺陷型细胞模型来进行功能验证。Dicer酶属于核酸内切酶的一种,可特异识别dsRNA并将其切割成19~22bp的小RNA。如果Dicer酶发生功能缺失将无法行使剪切功能。Dicer缺陷型细胞将无法加工小RNA如siRNA等,是一种理想的细胞模型。
3.人工miRNA抑制物(Artificial miRNA inhibitors)
Artificial miRNA inhibitors也叫antisense Oligonucleotide miRNA inhibitors,也被叫做antimiRs、antagomiRs等,是一种人工合成的用于竞争结合miRNA的RNA片段。目前有非常成熟的商业化产品。通常,研究者们会把这类RNA用慢病毒转导的方式送入体内。这类RNA通常也需要质粒载体的帮助。载体中普遍使用U6启动子稳定表达antimiRs,从而达到竞争结合miRNA的目的。
4.基因敲除或沉默(gene knockdown or gene silencing)
CRISPR-Cas9作为一种高效廉价的基因编辑工具,可以帮助科研工作者轻易地完成特定区域的DNA编辑。而CRISPR-c2c2则靶向RNA,对RNA进行编辑。这两款工具正逐步替代传统锌指蛋白和RNA干扰技术,成为当前科研界主流的基因编辑工具。例如您可以利用CRISPR-Cas9技术敲除lncRNA基因上的特定区域,观察lncRNA缺陷带来的后续影响。当然也可以利用c2c2酶靶向RNA,使其沉默。主流的Cas9酶和gRNA运输方法采用的仍然是传统的慢病毒包装质粒载体的方式入侵细胞,但是目前最新的技术是采用带正电荷的金属纳米颗粒与带负电荷的Cas9蛋白进行自主结合,从而高效地完成转导输送任务。2013年,科学家曾经对大脑中表达丰度很高circRNA上竞争结合microRNA的区域进行突变,发现circRNA对miR-7有吸附作用。
5.CLIP-sequencing(crosslinking-immunity precipitation and high-throughput sequencing)
CLIP-seq也叫紫外交联免疫沉淀结合高通量测序,是一项在全基因组水平揭示RNA分子与RNA结合蛋白相互作用的革命性技术。一些蛋白会和RNA相结合形成RNA-蛋白复合物(complex),这些复合物在紫外线的照射下会发生偶联。接着选用特定的抗体将这些复合物沉淀下来,使用蛋白酶消化蛋白,回收RNA进行上机测序。检测蛋白复合物,如AGO、RISC等均可使用CLIP-seq。类似其他方法还有通过不同的盐浓度和离子浓度析出蛋白等。
6.核质分离试剂盒
核质分离试剂盒可以区分RNA来自于细胞核还是细胞质,RNA在细胞的不同部位会行使不同的生物学功能。
7.双荧光素酶报告基因
双荧光素酶报告基因实验是通过将预测能够与miRNA结合的靶基因3’UTR序列(或ncRNA的miRNA结合序列)插入载体中萤火虫荧光蛋白(firefly luciferase)的3’UTR。当我们感兴趣的miRNA和质粒中的插入序列结合后,miRNA会通过和所插入的序列结合从而抑制萤火虫荧光蛋白的翻译最终造成荧光值的下降。海肾素荧光蛋白(renilla luciferase)是作为内参来去除组间的转染效率差异的。利用双荧光素酶报告基因实验的荧光值可以判断miRNA是否和靶基因结合。
8.FISH共定位
荧光原位杂交(FISH)指将特定标记的已知顺序核酸为探针与细胞或组织切片中核酸进行杂交,从而对特定核酸顺序进行精确定量定位的过程。通过共定位分析辅助判断miRNA是否与circRNA/lncRNA存在结合(作为实验证据之一)。
4.2 蛋白组学验证:
1) 基于抗体的验证方法:
可采用基于抗体的Western Blot、免疫组化、ELISA等方法验证不同样品(如实验组和对照组)中蛋白表达或修饰水平的差异。
2) 基于质谱的验证方法:
可采用靶向质谱检测技术对不同样品(如实验组和对照组)中蛋白表达或修饰水平的差异进行验证。优先推荐PRM (Parallel Reaction Monitoring,平行反应监测)。PRM 是一种基于高分辨、高精度质谱的离子监视技术,能够对目标蛋白质、目标肽段(如发生翻译后修饰的肽段)进行选择性检测,从而实现对目标蛋白质/肽段进行相对/绝对定量。
3) 基于RT-PCR的验证方法(一般不建议):
当上述检测条件不能满足时,可以考虑使用RT-PCR方法来验证,但是由于存在转录后调控、蛋白质翻译水平调节和蛋白质降解等生物过程,转录水平的变化和蛋白水平的变化未必能完全对应。
干货:转录组生信分析流程大比拼,你pick哪一款 | 转录调控专题
所见即所得,绘图高规格联川云平台,让科研更自由